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摘要 : [目的 /意义 ] 用 数理 统计 的 方法 探索 PLoS 平台 开放 获取 的 学 术 论文 在 网 络 媒体 中 浏览 量 的 累积 规 
律 ,丰富 对 Altmetrics 指标 的 研究 方法 。[ 方 法 /过 程 ] 跟踪 记录 PLoS Biology 和 PLoS Medicine 期 刊 2016 年 11 
月 份 发 表 的 38 篇 研究 论文 的 浏览 量 数据 ,数据 收集 截止 到 2017 年 10 月 16 日 。 利 用 曲线 拟 合 和 计算 特别 节点 
等 方法 对 所 记录 数据 进行 统计 学 分 析 及 检验 ,探索 总 浏览 量 指标 的 累积 规律 。[ 结果 /结论 ] 总 浏览 量 累积 曲 
线 与 对 数 曲 线 拟 合 优 度 最 高 ,平均 为 0.97; 计 算出 累积 曲线 的 特别 节点 S(x,y) ,将 总 浏览 量 累积 过 程 分 为 集中 
浏览 期 和 分 散 浏览 期 两 个 阶段 ,其 中 集中 浏览 期 约 占 总 阶段 的 109% ,而 浏览 量 却 超过 了 全 部 浏览 量 的 55% 。 
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累积 规律 


) 在 科学 研究 开放 化 ,交互 化 的 大 环境 下 , 越 来 越 多 
的 研究 人 员 在 科学 研究 和 学 术 交 流 过 程 中 应 用 社会 网 
颖 六 上 央 , 如 维基 百科 .博客 .社会 化 书签 . 微 博 等 ,这 些 
社论 网 络 行为 产生 了 丰富 的 在 线 活动 “印迹 ” ,为 计量 
学 御 究 发 展 提供 了 新 兴 的 多 元 化 指标 
riesgl 。Altmetrics 最 初 提出 就 是 利用 学 术 社交 平台 上 
网 妃 数 据 来 弥补 传统 计量 学 中 基于 引用 的 评价 指标 的 
不 定 , 例 如 运用 文献 管理 平台 CiteULike .Mendeley 中 的 
文具 阅 读 量 和 推荐 量 以 及 开放 同行 评审 F1000 中 的 推 
荐 量 作为 评估 文献 被 利用 的 情况 。Altmetrics 研究 之 
初 ,Altmetrics 指标 与 传统 引用 指标 之 间 的 相关 性 问题 
是 衡量 Altmetrics 指标 评价 文献 价值 合理 性 的 标准 吕 。 
目前 对 Altmetrics 的 研究 集中 在 各 指标 与 传统 引用 指 
标 之 间 的 相关 性 研究 ,以 及 探讨 如 何以 Altmetrics 为 基 
础 建立 学 术 期 刊 或 学 术 论文 的 评价 指标 体系 。 研 究 表 
明 ,Altmetrics 所 包含 的 指标 中 , 仅 少数 指标 与 引文 存 
在 中 度 相 关 性 ,其 他 多 数 指标 与 引文 并 不 相关 中 。 另 
有 研究 指出 ,Altmetrics 能 够 从 不 同 维度 揭示 科研 成 果 


Altmet- 


体 ,是 多 维度 指标 ,不 能 简单 地 .不 加 区 分 地 混在 一 起 
进行 研究 ”。 对 Altmetrics 单项 指标 的 研究 目前 多 集 
中 于 Mendeley 和 Twitter。 其 中 M，Thelwalli 和 以 Men- 
deley 指标 为 研究 对 象 ,探究 为 何 文献 的 传统 引用 指标 
数量 多 数 情况 下 与 Mendeley 使 用 情况 不 相符 ,研究 发 
现 科研 论文 内 容 涉 及 学 科 的 广泛 程度 的 不 同 导致 文献 
受众 人 群 数量 的 差异 ,进而 造成 了 Mendeley 使 用 情况 
与 引文 数量 差异 较 大 的 现象 。Q. Ke ”等 系统 地 研究 
了 Twitter 指标 ,提出 利用 Twitter 精确 标识 科研 人 员 的 
方法 。 研 究 发 现 , Twitter 在 不 同学 科 和 不 同 领域 受 欢 
迎 程度 是 不 同 的 ,从 事 社 会 科学 研究 的 学 者 使 用 Twit- 
ter 的 频率 更 高 。 
本 研究 认为 前 人 的 研究 尚 有 两 点 不 足 : 中 无 论 是 
Altmetrics 综合 指标 还 是 单 指标 的 系统 研究 ,研究 数据 
均 是 某 一 个 特定 时 间 点 所 采集 到 的 Altmetrics 数据 , 缺 
少 从 时 间 变 化 的 角度 去 探究 指标 变化 趋势 的 研究 ;@) 
无 论 是 Mendeley 还 是 Twitter ,对 单 篇 论文 的 覆盖 率 都 
无 法 达到 100% , 即 并 不 是 所 有 的 论文 都 会 被 Mendeley 


的 影响 力 , 且 影响 力 本 身 也 可 以 是 多 维度 的 ,比如 社会 
影响 力 与 学 术 影响 力 ”。 由 于 Altmetrics 指标 是 由 多 
个 不 同类 型 .属性 和 来 源 的 指标 "交织 "在 一 起 的 集合 


j 户 使 用 或 被 Twitter 用 户 传播 ,因此 在 一 定 程度 上 缩 
小 了 研究 范围 。 
为 了 弥补 前 人 研究 的 不 足 ,本 研究 利用 跟踪 统计 


作者 简介 : 王 真 ( ORCID: 0000 -0002 -2212 -4536) ,硕士 研究 生 ; 马 建华 ( ORCID: 0000 - 0002 -7945 -9150) ,研究 馆 员 ,博士 ,硕士 生 导 


师 ,通讯 作 者 ,E-mail: majh@mail. las. ac. cn。 


收 稿 日 期 :2017 -12 -25 修 回 日 期 :2018 -02 -06 本 文 起 止 页 码 :72 -83 ”本 文责 任 编辑 : 王 传 清 


72 


eR 
王 真 , 蕊 建华 . 基于 PLoS 开放 获取 数据 的 单 篇 论文 网 络 浏览 量 累积 规律 的 数理 统计 及 分 析 [J]. 全 贷 基 各 


(12):72-83. 


数据 的 方法 ,基于 PLoS article -level metrics 的 开放 数 
据 , 以 PLoS Biology 和 PLoS Medicine 两 种 期 刊 的 论文 
为 研究 对 象 ,跟踪 收集 了 这 些 论文 从 2016 年 11 月份 
发 表 后 到 2017 年 10 月 的 Altmetrics 数据 。 从 时 间 变 
化 的 角度 去 探索 Altmetrics 指标 变化 的 趋势 。 出 于 对 
单 篇 论文 的 覆盖 率 以 及 时 效 性 的 考虑 ,本 研究 首先 选 
择 Altmetrics 中 的 总 浏览 量 (View ) 指标 进行 重点 分 析 。 
通过 数学 方法 ,发 现 并 归纳 出 PLoS Biology 和 PLoS 
Medicine 两 种 期 刊 论文 的 网 络 浏览 量 的 变化 和 累积 规 
律 ,为 期 刊 出 版 者 及 科研 管理 者 提供 参考 和 借鉴 。 


1 数据 来 源 


以 PLoS 开放 平台 上 PLoS Biology 和 PLoS Medicine 
两 种 期 刊 发 表 的 论文 为 研究 对 象 ,系统 跟踪 和 记录 这 
- 刊 论文 Altmetrics 指标 中 的 浏览 量 数据 。 选 择 

种 期 刊 的 主要 原因 有 :GD P1os Biology 和 PLoS 
Medhitine 均 属 于 PLoS 开放 获取 平台 上 的 网 络 期 刊 ,其 

trics 数据 便于 跟踪 并 且 累 积 较 快 ,可 信 程 度 更 
高 x 贸 这 两 种 期 刊 分 别 是 生物 学 和 医学 领域 的 高 影响 
区 前 刊 ,因此 认为 其 数据 量 较 大 ,更 具有 统计 学 意义 。 
CO 妆 所 收集 工作 持续 时 间 约 为 一 年 , 自 2016 年 10 
忆 元 开始 ,截止 日 期 为 2017 年 10 月 16 日。 其间, 每 
鸡 浏 览 pros Biology 和 PLos Medicine 的 网 站 ,记录 和 
更 闫 研究 论文 的 浏览 量 数据 。 PLoS 网 站 的 Altmetrics 
er 这 样 就 为 本 研究 的 数据 记录 提供 了 基 

考虑 到 数据 收集 的 工作 量 以 及 浏览 量 数据 在 论 

表 初 期 的 快速 积累 特点 ,本 研究 在 论文 发 表 初 期 
me 
的 频率 ,在 论文 发 表 3 个 月 后 记录 的 频率 为 每 月 记录 
一 次 。 经 过 近 一 年 的 数据 跟踪 , 共 收集 了 2016 年 11 
月 份 发 表 在 PLoS Biology 上 的 22 篇 研究 论文 和 发 表 在 
PLoS Medicine 上 的 16 篇 共计 38 篇 研究 论文 近 一 年 的 
浏览 量 数据 。 通过 PLoS 官方 对 浏览 et hy 
究 中 ,文献 总 浏览 量 是 各 种 类 型 浏览 量 的 合计 , 见 表 1。 
总 浏览 量 由 5 部 分 数据 构成 ,分 别 来 自 PLoS 和 PMC 
(PubMed Central ) 两 个 网 站 中 的 HTML 浏览 量 .PDF 下 

表 1 总 浏览 量 指标 包含 的 各 类 分 指标 


网 页 浏览 量 PDF 下 载 量 《XML 下 载 量 总 计 

PLoS PLoS HTML PLoS PDF PLoS XML PLoS 平台 
页 面 浏 览 下 载 下 载 总 计 

PMC ~ PMC HTML PMC PDF PMC 平台 
页 面 浏览 下 载 总 计 


载 量 和 XML 浏览 量 的 总 和 


HA 
人 oo 


,其 中 PMC 不 提供 XML 浏 


2 总 浏览 量 累 积 趋 势 及 拟 合 曲线 研究 


为 探究 总 浏览 量 芯 


曲线 连接 起 来 ,绘制 出 论文 总 浏览 量 的 时 序 趋势 图 , 见 


累积 规律 ,将 观测 值 用 平滑 的 
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图 1 单 篇 论文 总 浏览 量 随 论 文 发 表 天 数 


增加 而 累积 的 曲线 


1 中 的 两 个 折线 图 集 分 别 为 PLoS Biology 和 
PLoS Medicine 期 刊 单 篇 论文 的 总 浏览 量 随 论文 发 表 天 
数 增加 而 累积 的 曲线 。 很 显然 ,总 浏览 量 累 积 曲 线 呈 
规律 性 增长 :论文 发 表 初 期 ,浏览 量 急 速 增加 ; 随 着 发 
表 天 数 的 增加 ,曲线 开始 呈现 趋 缓 的 发 展 态势 。 这 表 
明 ,论文 一 经 发 表 就 得 到 了 大 量 浏览 或 阅读 ,而 随 着 发 
表 时 间 的 增加 ,被 浏览 的 热度 人 
段 后 ,浏览 量 增 加 的 幅度 就 变 得 更 小 。 这 可 以 说 明 研 
究 人 员 在 浏览 期 刊 网 站 时 更 倾向 于 点 击 最 新 发 表 的 论 
文 , 因 而 使 论文 的 总 浏览 量 在 发 表 初 期 快速 积 和 
2.1 ee 

为 进一步 探讨 总 浏览 量 的 变化 规律 ,对 总 浏览 量 
a 曲线 拟 合 。 览 量 0 

察 可 知 ,论文 发 表 初 期 ,总 浏览 量 快速 累积 ;但 论 
de 0 nn 
随时 间 而 变 小 。 从 函数 的 角度 来 看 ,由 于 横 坐 标 代 表 
天 数 ， ， 总 浏览 量 , 因 此 只 有 第 一 象限 内 的 函 
数 图 像 是 有 意义 的 。 由 于 浏览 量 是 累积 值 ,随时 间 的 
延长 而 增 大 ,因此 拟 合 函数 图 像 在 第 一 象限 内 应 是 增 
函数 , 且 随 x 的 增 大 曲线 的 斜率 逐渐 变 小 。 上 述 函 数 
曲线 的 特征 与 对 数 曲 线 相似 。 

此 外 ,还 有 一 种 情况 需要 考虑 ,就 是 个 别 含有 重大 
发 现 或 内 容 极 具 争 议 性 的 论文 ,不 像 一 般 论 文 在 发 表 
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一 段 时 间 后 出 现 平 稳 累积 状况 ,而 是 出 现 爆发 式 增长 
的 情况 , 即 论文 发 表 一 段 时 间 后 浏览 量 的 累积 速度 加 
快 。 函 数 图 像 中 表现 为 斜率 突然 增 大 ,在 统计 学 中 ,经 
常用 S 型 曲线 模型 来 模拟 这 种 经 过 一 段 时 间 后 增长 速 
度 突然 变 快 的 情况 。 
因此 本 研究 选择 对 数 曲 线 模 型 .S 型 曲线 模型 和 
Logistic 模型 对 一 年 内 总 浏览 量 的 累积 曲线 进行 曲线 
合 。 本 研究 使 用 SPSS 工具 ,SPSS 给 出 的 拟 合 模 型 如 
公式 (1) 到 公式 (3) ,其 中 e 为 自然 底数 ,uw 为 上 界 值 。 


Tn 


对 数 曲 线 :f(x) = bo +bi* nx 公 臣 (1) 
5 曲线 (4) = 公式 (2) 
Logistic 模型 .f(x) = 2 公式 (3) 


1 2 
《本 + 加 * b1) 


总 浏览 量 累积 曲线 拟 合 结果 
利用 SPSS 软件 对 总 浏览 数据 的 观测 值 与 对 数 曲 


模型 图 , 拟 合 结果 见 表 2 - 表 4 ,模型 图 见 图 2。 
在 表 2 - 表 4 中 ,Article ID 为 本 研究 案例 中 研究 


论文 的 唯一 标识 符 , 其 中 以 PB 开头 的 ID 表示 该 论文 
发 表 于 PLoS Biology ,PM 则 表示 PLoS Medicine ,PB 和 
PM 后 所 接 的 数字 为 PLoS 网 站 提供 的 论文 编号 ;R 为 
所 选 模 型 对 观测 值 的 拟 合 优 度 决定 系数 ,R 的 值 越 接 
近 1 说 明 所 选 模型 越 能 精确 描述 观测 值 变化 的 趋势 特 
征 ; 严 值 是 回归 函数 的 显著 性 检验 ;d1 与 dp 的 和 表示 
每 篇 文章 被 跟踪 记录 的 次 数 , 即 观测 值 的 个 数 ;sig 是 
Ff 检验 的 概率 值 ;6 与 5b 为 拟 合 曲线 函数 的 两 个 参 
数 。 

设 截止 到 2017 年 10 月 16 日 当天 所 累积 的 总 浏 
览 量 为 V, 表 2 -- 表 4 中 论文 出 现 的 次 序 以 V 升 序 排 
序 , 即 位 于 表 中 第 一 行 的 研究 论文 PB_1002571 的 总 浏 
览 累积 量 最 少 ,最 后 一 行 PB_1002570 总 浏览 量 累积 数 
量 最 多 。 


型 曲线 和 Logistic 模型 曲线 进行 曲线 拟 合并 绘制 
表 2 对 数 模 型 的 拟 合 结果 
Article ID V R? Fr dfl dp sig bo bi 
PB_1002571 3.137 0.97 1 050.37 1 37 0.00 =233.30 S97,21 
PM_1002161 3 613 0.94 479.99 1 30 0.00 -97.12 686. 89 
PM_1002172 4 429 0.96 390.74 1 18 0.00 一 669.53 918.01 
PB_2000391 4 500 0.95 492.51 1 28 0.00 —1 401.35 3 1 
PB_1002576 4 557 0.95 571.44 1 29 0.00 —963.75 998.26 
PB_2000206 4 784 0.96 824.34 1 33 0.00 —1 488.83 1 109,37 
PB_2000117 4 821 0.99 6 359. 83 1 37 0.00 一 605.77 913. 69 
PB_2000127 4 889 0.96 350.72 1 16 0.00 -1 156.16 1 109.04 
PM_1002171 4 906 0.98 746. 29 1 18 0.00 = 也 1 056. 19 
PB_1002580 5 106 0.95 500. 35 1 24 0.00 —1 586.38 1 205.07 
© PB_2000504 5 108 0.96 445.28 1 18 0.00 —1 204.40 1 138.18 
PM_1002167 3 127 0.97 760.57 1 24 0.00 —948.67 1 072.14 
PM_1002178 5 270 0.96 487.29 1 19 0.00 -1 227.36 1 155.30 
PM_1002175 5 561 0.98 922.73 1 19 0.00 一 880.71 1 126.62 
PM_1002159 5 601 0.98 1919.25 1 32 0.00 一 646.50 1 040. 55 
PB_2000998 5 653 0.97 678.84 1 18 0.00 —1 586.34 1 299. 58 
PM_1002166 5 696 0.98 953, 71 1 24 0.00 —1 402. 16 1 223. 54 
PB_1002578 5 885 0.96 594.73 1 24 0.00 -1 060.70 1 254.23 
PB_1002569 5 986 0.99 3 121.27 1 38 0.00 171.67 1 006. 28 
PB_2000237 6 081 0.97 995.76 1 28 0.00 -2 061.57 1 415.37 
PB_1002577 6 259 0.96 648.43 1 24 0.00 —1 710.78 1 410.61 
PB_2000733 6 700 0.98 1 178.05 1 24 0.00 -2 397.38 1 582.33 
PB_2000638 6 730 0.98 1 415.03 1 28 0.00 =103.67 1 364.52 
PM_1002149 6 935 0.95 553.60 1 32 0.00 —1 574.24 1 316. 88 
PB_1002581 6 941 0.98 1 045.45 1 21 0.00 —2 360.04 1 644.91 
PM_1002169 6 948 0.98 1 158.23 1 20 0.00 =9055.35 1 395.08 
PB_1002579 7 035 0.98 1 106.48 1 22 0.00 = 上 023.03 1 630. 05 
PM_1002170 7 499 0.98 934.81 1 20 0.00 -1 514.45 1 597.87 
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( 续 表 2) 
Article ID V R? F dfl dp Sig bo b1 
PM_1002155 8 088 0.92 375.61 1 31 0.00 -3 181.36 1 725.35 
PB_1002575 8 884 0.98 1 424. 06 1 24 0.00 -2 460.17 1 920. 67 
PB_2000598 9 338 0.99 2 864. 34 1 17 0.00 -2 500.76 2 085.75 
PM_1002164 10 137 0.99 3 070.23 1 30 0.00 —1 249.03 1 897.55 
PM_1002160 10 259 0.96 763.24 1 30 0.00 -2 255.22 2 020. 42 
PM_1002152 10 533 0.91 333.58 1 31 0.00 -2 310.13 1 890.60 
PB_1002573 16 043 0.99 2 380. 55 31 0.00 —594. 83 2 888.60 
PB_2000225 17 666 0.99 2 217. 82 1 24 0.00 -6 418.30 4 070.51 
PM_1002158 17 961 0.99 2 095. 09 1 30 0.00 256. 58 3 049.60 
PB_1002570 21 768 0.99 2 707.61 1 41 0.00 -1727.39 3 908.23 
表 3 S 曲线 模型 的 拟 合 结果 
Article ID V R? a dfl dp sig bo b1 
PB_1002571 3 137 0.97 1 237. 55 1 37 0.00 7.97 —11.35 
PM_1002161 3 613 0. 86 185. 69 1 30 0.00 8.02 —5.86 
PM_1002172 4 429 0.95 317.98 1 18 0.00 8.25 —8.83 
2 PB_2000391 4 500 0.87 191.97 1 28 0.00 8.15 —10.46 
PB_1002576 4 557 0.92 340. 62 1 29 0.00 8.24 一 9.66 
PB_2000206 4 784 0.92 360. 89 | 33 0.00 8.23 -11.85 
PB_2000117 4 821 0.92 431. 19 1 37 0.00 8.29 -11.01 
目 PB_2000127 4 889 0.96 373. 10 1 16 0.00 8. 45 —12.04 
SS pM_1002171 4 906 0.89 147.77 1 18 0.00 8.26 -9.12 
PB_1002580 5 106 0.91 242. 55 24 0.00 8. 45 -14.65 
PB_2000504 5 108 0.94 297.32 1 18 0.00 8.40 -10.75 
PM_1002167 5 127 0.90 220.00 1 24 0.00 8.38 —10.18 
PM_1002178 5 270 0. 88 134. 99 1 19 0.00 8.34 一 9.04 
PM_1002175 5 561 0.93 237.25 1 19 0.00 8.42 一 8.29 
PM_1002159 5 601 0.95 651.39 1 32 0.00 8.48 -12.02 
PB_2000998 5 653 0.90 168.91 1 18 0.00 8. 45 -10.59 
PM_1002166 5 696 0.84 125. 82 24 0.00 8.40 -10.22 
PB_1002578 5 885 0.86 145. 99 1 24 0.00 8.47 -7.85 
C= PB_1002569 5 986 0.94 569. 65 1 38 0.00 8.57 一 8.91 
{ 9 PB_2000237 6 081 0.80 112. 99 1 28 0.00 8.39 -10.31 
PB_1002577 6 259 0.92 262.38 1 24 0.00 8.66 -15.19 
PB_2000733 6 700 0.91 228. 88 1 24 0.00 8.67 —15.95 
PB_2000638 6 730 0.92 325. 96 1 28 0.00 8.60 -8.60 
PM_1002149 6 935 0.80 131.50 1 32 0.00 8.49 -11.59 
PB_1002581 6 941 0.93 272. 98 1 21 0.00 8.69 -13.74 
PM_1002169 6 948 0.94 341.60 1 20 0.00 8.77 -12.07 
PB_1002579 7 035 0.94 359. 52 1 22 0.00 8.74 —12.48 
PM_1002170 7 499 0.94 329. 58 1 20 0.00 8. 85 -13.45 
PM_1002155 8 088 0.79 114.74 1 31 0.00 8.53 —14.79 
PB_1002575 8 884 0. 88 174. 13 1 24 0.00 8.92 —14.25 
PB_2000598 9 338 0.96 406. 02 1 17 0.00 8.96 —10.73 
PM_1002164 10 137 0.90 276. 61 1 30 0.00 8.92 -7.19 
PM_1002160 10 259 0. 82 134. 48 1 30 0.00 8.79 -7.29 
PM_1002152 10 533 0.76 96.76 1 31 0.00 8.81 —10.99 
PB_1002573 16 043 0.91 300. 56 1 31 0.00 9.50 -7.57 
PB_2000225 17 666 0.91 228. 88 Jj 24 0.00 9.54 —14.24 
PM_1002158 17 961 0.94 451. 87 1 30 0.00 9.60 一 6.29 
PB_1002570 21 768 0.94 694.43 1 41 0.00 9.79 —9.80 
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表 4 Logistic 模型 拟 合 结果 


Article ID V R? Fr afl dp sig bo bi 
PB_1002571 3 137 0.53 41.76 1 37 0.00 0.00 1.00 
PM_1002161 3 613 0.47 26.59 1 30 0.00 0.00 1.00 
PM_1002172 4 429 0.44 14.23 1 18 0.00 0.00 1.00 
PB_2000391 4 500 0.45 23:07 1 28 0.00 0.00 0.99 
PB_1002576 4557 0.41 20.49 1 29 0.00 0.00 1.00 
PB_2000206 4784 0.41 22. 80 1 33 0.00 0.00 0.99 
PB_2000117 4 821 0.65 69.27 1 37 0.00 0.00 1.00 
PB_2000127 4 889 0.55 19.73 1 16 0.00 0.00 0.99 
PM_1002171 4 906 0.53 20. 18 1 18 0.00 0.00 0.99 
PB_1002580 5 106 0.62 38.40 1 24 0.00 0.00 1.00 
PB_2000504 5 108 0.48 16. 85 1 18 0.00 0.00 0.99 
PM_1002167 5 127 0.54 27.62 1 24 0.00 0.00 1.00 
PM_1002178 5 270 0.51 19.99 1 19 0.00 0.00 0.99 
PM_1002175 5 561 0.51 19.63 1 19 0.00 0.00 1.00 
PM_1002159 5 601 0.61 51.06 1 32 0.00 0.00 1.00 
PB_2000998 5 653 0.54 21.04 1 18 0.00 0.00 0.99 

, PM_1002166 5 696 0.61 37.01 1 24 0.00 0.00 1.00 
PB_1002578 5 885 0.54 28.39 1 24 0.00 0.00 1.00 
PB_1002569 5 986 0.62 63.05 1 38 0. 00 0. 00 1.00 
PB_2000237 6 081 0.61 43.24 1 28 0.00 0.00 1.00 
PB_1002577 6 259 0.67 48.13 1 24 0.00 0.00 1.00 
PB_2000733 6 700 0.70 55.74 1 24 0.00 0.00 1.00 
PB_2000638 6 730 0.43 20.73 1 28 0.00 0.00 1.00 
PM_1002149 6 935 0.84 169.16 1 32 0.00 0.00 1.00 
PB_1002581 6 941 0.60 32.07 1 21 0.00 0.00 0.99 
PM_1002169 6 948 0.68 41. 85 1 20 0.00 0.00 1.00 
PB_1002579 7 035 0.59 31.18 1 22 0.00 0.00 0.99 
PM_1002170 7 499 0.65 37:73 1 20 0.00 0.00 1.00 

PM._1002155 8 088 0.84 160.60 1 31 0.00 0.00 1.00 
PB_1002575 8 884 0.77 79.70 1 24 0.00 0.00 1.00 
PB_2000598 9 338 0.55 20. 62 1 17 0. 00 0.00 0.99 
PM_1002164 10 137 0.52 31:97 1 30 0.00 0.00 1.00 
PM_1002160 10 259 0.64 54.27 1 30 0.00 0.00 1.00 
PM_1002152 10 533 0.87 202.97 1 31 0.00 0.00 1.00 
PB_1002573 16 043 0.52 33,93 1 本 0.00 0.00 1.00 
PB_2000225 17 666 0.71 59.61 1 24 0.00 0.00 0.99 
PM_1002158 17 961 0.43 22. 86 1 30 0.00 0.00 1.00 
PB_1002570 21 768 0.55 49.15 1 41 0.00 0.00 1.00 


2 中 每 一 张 小 图 为 一 篇 研究 论文 的 曲线 佑 计 模 


型 图 ,总 计 38 张 。 图 中 


圆圈 为 观测 值 , 实 线 为 拟 合 对 


数 函 数 曲线 ,虚线 为 Logistic 模型 拟 合 函数 曲线 ,虚线 
与 点 组 合 的 线 为 S 曲线 拟 合 函 数 曲线 。 
观察 模型 图 发 现 ,对 数 函 数 的 拟 合 曲线 与 观测 值 的 


上 内 


EE 一 率 最 大 ,S 型 曲线 次 之 ,Logistic 模型 上 
乎 没有 重 麦 。 虽 然 以 升序 的 方式 对 模型 图 进行 了 排列 ， 


2.3 ”曲线 拟 合 优 度 决 定 参数 R 的 比较 


本 研究 观测 的 论文 样本 数量 为 38 个 ,每 种 曲线 拟 
E 38 个 R 值 , 求 出 每 种 曲线 拟 合 R2 的 描述 性 统 
计量 见 表 5。R 值 越 接近 1 拟 合 优 度 越 高 , 拟 合 结果 


合 产 4 


由 线 观 测 值 几 


但 图 形 的 趋势 和 拟 合 优 度 并 没有 明显 的 规律 性 变化 。 
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合 优 度 。 


显示 ,对 数 曲 线 的 拟 合 优 度 最 高 ,平均 值 为 0.97, 且 对 
数 曲线 的 R 的 极 差 方差 .平均 差 和 标准 差 都 是 最 小 
的 ,说 明 论文 受 关注 度 的 大 小 不 会 影响 对 数 曲线 的 拟 
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h 


〇 ”未 5 3 种 曲线 拟 合 参数 R2 的 描述 统计 什 
拟 合 模 型 ”有效 数据 极 差 最 小 值 最 大 值 平均 值 标准 差 方差 
二 数 模型 R2 38 0.08 0.92 0.99 0.97 0.02 0.00 


2 


S 曲线 模型 R? 38 0.21 0.76 0.97 0.90 0.05 0.00 


logistic 模 型 R? 38 0.46 0.41 0.87 0.58 0.12 0.01 


S 曲线 的 拟 合 优 度 也 相对 较 高 ,S 曲线 的 R 值 在 
0.75 -0.97 之 间 波 动 。 

为 探究 S 曲线 和 对 数 曲线 与 受 关注 度 不 同 的 论文 
浏览 量 累积 曲线 拟 合 的 优 劣 ,将 R2 值 按 View 升序 排 
列 并 给 于 1,2,3，…… ,38 的 序号 ,绘制 出 以 序号 为 横 
坐标 ,以 对 数 曲 线 和 S 曲线 拟 合 优 度 决 定 参 数 R 的 带 
点 折线 图 , 见 图 3。 

观察 图 3 发 现 , 对 数 曲 线 的 R 折线 图 总 体 在 S 曲 
线 的 R2 折线 图 的 上 方 ,S 曲线 的 R 值 在 折线 图 的 左 
端 更 接近 1, 并 且 1 号 论文 $ 曲线 的 R2 超过 了 对 数 曲 


1.00 


0.95 


拟 合 优 度 到 
© © 
名 号 


0.80 


也 站 


0 5 10 15 20 2 30 35 40 
样本 序号 


3 ”对 数 曲 线 与 S 曲线 拟 合 优 度 决定 参数 R2 折线 图 


线 的 RR。 除 了 1 号 和 8 号 论文 外 ,其 余 论文 的 浏览 量 
的 累积 曲线 都 与 对 数 曲线 的 拟 合 优 度 更 高 。 
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通过 对 总 浏览 量 的 累计 趋势 曲线 的 研究 发 现 , 研 
究 人 员 在 网 络 中 更 倾向 于 点 击 最 新 发 表 的 论文 ,因此 
总 浏览 量 在 论文 发 表 初期 便 能 够 快速 累积 ,其 拟 合 曲 
线 和 对 数 曲线 和 S 型 曲线 的 前 期 都 是 比较 一 致 的 。 而 
在 中 期 阶段 ,S 型 曲线 和 对 数 曲线 有 明显 的 不 同 ,S 曲 
线 在 达到 人 钨 和 值 后 曲线 会 趋向 平稳 ,而 对 数 曲线 的 增 
长 速度 虽然 也 在 减 小 但 却 并 不 会 出 现 一 个 几乎 不 增加 
的 平台 区 。 现 实 中 ,研究 论文 的 网 络 浏览 量 没有 表现 
出 明显 的 临界 值 ,因此 用 对 数 曲 线 模拟 论文 的 总 浏览 
累积 曲线 更 合理 。 

受 关注 度 相对 较 低 的 研究 论文 ,其 累积 总 浏览 量 
似乎 与 $ 曲线 的 拟 合 优 度 更 高 ,说 明 这 些 论文 发 表 后 ， 
初期 也 获得 了 研究 人 员 的 关注 ,但 是 ,之 后 就 不 再 被 人 
浏 蜂 和 阅读 。 该 现象 背后 的 原因 尽管 不 是 很 清楚 ,但 
三 以 下 两 种 可 能 性 :四 这 些 论文 的 学 术 价值 可 能 
稳 别 高 ,因此 其 浏览 量 到 达 一 个 类 似 临 界 值 后 便 几 
aa one 
柱 击 领域 的 热点 问题 或 研究 前 沿 , 或 者 说 ,这 类 研究 是 
- 偷 相 对 罕 的 或 者 冷 个 的 方向 ,并 不 会 引起 更 多 人 的 
持 强 关注 。 


寺 别 节点 的 理论 探寻 及 


伺 设置 特别 节点 S(x,y) 的 意义 

:通过 上 述 研究 可 以 发 现 ,论文 的 总 浏览 量变 化 非 
常 等 合 对 数 曲 线 , 即 总 浏览 量 在 经 历 了 快速 增长 期 之 
后 5 其 单位 时 间 内 的 增长 速率 开始 变 小 ,总 浏览 量 呈 现 
稳 曲 .小 幅度 增加 。 本 研究 把 总 浏览 量 快速 昧 积 的 阶 
段 称 为 “集中 浏览 期 ”, 把 之 后 的 平稳 阶段 称 为 “分 散 


浏览 期 ” 。 此 两 个 阶段 之 间 会 有 一 个 节点 ,本 研究 称 之 
为 “总 浏览 量 累积 过 程 的 特别 节点 ” ,用 S(x,y) 表示。 


由 于 对 数 函 数 本 身 为 增 函 数 ,在 数学 意义 上 没有 和 斜率 
变化 的 分 界 点 即 拐点 , 因 此 S(x,y) 是 人 为 定义 的 特别 
节点 。 

一 篇 研究 论文 浏览 量 的 特别 节点 S(x,y) 表 示 该 
论文 发 表 * 天 后 ,单位 时 间 内 增加 的 浏览 量 开始 逐渐 
稳定 ,这 些 天 的 总 浏览 量 为 y。 由 于 每 篇 论文 的 影响 
力 不 同 ,其 受到 的 关注 程度 也 不 同 ,因此 每 篇 论文 的 5 
(xz,y) 的 位 置 也 是 不 同 的。 只 有 标准 化 后 的 特别 节点 
SCxz,y) 才 能 在 不 同 论文 之 间 进 行 比较 ,进而 可 在 一 定 
程度 上 揭示 一 es 网 啊 力 与 受 关注 度 。 
3.2 ”特别 节点 S(x,y) 的 设置 方法 

由 于 S(x， ,本 身 是 人 为 定义 的 对 数 二 数 曲 线 上 
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的 特别 节点 ,因此 本 研究 认为 其 标准 化 的 计算 方法 不 
是 唯一 的 。 不 同 平台 ,不 同 开放 类 型 的 期 刊 的 集中 浏 
览 期 是 不 同 的 ,本 研究 只 针对 PLoS 开放 平台 上 的 总 浏 
览 量 累积 曲线 提供 一 种 可 能 的 S(x,y) 的 标准 化 计算 
方法 。 

已 知 用 对 数 函 数 拟 合 总 浏 
为 : 

f(x) =b, + * nx 公式 (4) 

为 寻找 单位 时 间 内 函数 增 量 出 现 变 化 的 点 , 即 斜 
率 变化 趋势 的 特殊 点 , 求 出 拟 合 函 数 /(x) 的 一 阶 导 
数 ,表达 式 为 : 

f(x)' =b/x 公式 (5) 

Ax) ' 是 反比 例 函数 ,由 反比 例 函 数 的 性 质 可 知 当 
x>0 时 f(x)' 是 减 函 数 ,为 了 寻找 原 函 数 /(x) 和 斜率 变 
化 的 特殊 点 即 f(x)' 曲 线 图 的 特殊 点 , 画 出 反比 例 函 数 


积 曲线 的 表达 式 


览 量 累 
刘 览 量 累 


y=1/x 在 第 一 象限 内 的 图 像 见 图 4 中 曲线 ,其 中 ,x e 
(0,10]: 
10 2 
9 ye 1 
| ~ 
"| 
7 上 
sl 
中 
| 
| 
3 
0 一 一 一 一 一 
0 1 pl 3 4 3 6 2 8 9 0 


图 4 y=1/x 与 y=xX 两 函数 当 xe (0,10] 时 的 函数 图 像 


总 浏览 量 累 积 曲 线 的 拟 合 原 函数 A x) 在 第 一 象 
限 内 为 增 函 数 ,因此 在 本 研究 中 儿 x)' 只 在 第 一 象限 内 
的 数据 是 有 意义 的 。 f(x) ' 在 第 一 象限 内 为 减 函数 ,其 
单位 时 间 的 减 量 当 到 达 距 离 原 点 (0,0) 的 平面 距离 最 
近 的 点 之 后 单位 时 间 内 的 减 量变 化 逐渐 平稳 , 即 如 图 
中 直线 与 曲线 的 交点 。/(x)' 曲 线 随 * 增 大 而 减 小 的 
幅度 从 这 一 点 开始 明显 变 绥 。f(x*) 的 这 一 变化 ,对 应 
f(x*) 曲线 从 这 一 点 开始 增长 速度 逐渐 平稳 ,逐渐 平稳 
且 趋 于 0 的 斜率 将 使 Ax) 看 上 去 更 像 一 条 斜率 为 常数 
的 直线 。 

通过 数学 推算 可 以 确定 :反比 例 函 数 距离 原点 (0， 
0) 平 面 距离 最 近 的 点 即 与 y=x 直线 的 交点 , 即 图 4 中 
的 曲线 与 直线 的 交点 (V6), Vb)。 

因此 原 函 数 人 x) = 5 + bi * nx 的 特别 节点 SCx， 
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y) 为 (VD) eg soir 篇 论 “至 2017 年 10 月 16 日 ,文章 共 发 表 了 D 天 ,累积 总 浏 
文 的 总 浏览 量 累积 曲线 特别 节点 S(x,y) 见 表 6。 设 截 。 先 量 为 V, 表 6 按 了 升序 排列 。 
表 6 样本 论文 总 浏览 量 累积 曲线 在 特别 节点 的 数据 计算 结果 


Article ID V D bo bl x y P., BE 
PB_1002571 3 137 357 -233.30 597.21 24.44 1 675.45 6.85% 53.41% 
PM_1002161 3 613 323 -97.12 686. 89 26.21 2 146.32 8.11% 59.41% 
PM_1002172 4 429 329 —669.53 918.01 30.30 2 461. 89 9.21% 55. 59% 
PB_2000391 4 500 341 —1 401.35 1 055. 17 32.48 2 271. 43 9.53% 50.48% 
PB_1002576 4 557 343 —963.75 998. 26 31.60 2 483.25 9.21% 54.49% 
PB_2000206 4 784 349 —1 488. 83 1 109.37 33.31 2 400.36 9.54% 50.17% 
PB_2000117 4 821 357 -605.77 913.69 30.23 2 508.78 8.47% 52.04% 
PB_2000127 4 889 321 -1 156. 16 1 109.04 33.30 2 731.71 10.37% 55.87% 
PM_1002171 4 906 329 -1 121.91 1 056. 19 32.50 2 554. 92 9. 88% 52.08% 
PB_1002580 5 106 334 —1 586.38 1 205.07 34.71 2 688.16 10.39% 52.65% 
PB_2000504 5 108 323 -1 204.40 1 138.18 33.74 2 800. 40 10.44% 54. 82% 
PM_1002167 5 .129 343 —948.67 1 072.14 32.74 2 791.70 9.55% 54.45% 
PM_1002178 5 270 329 -1 227.36 1 155.30 33.99 2 846.32 10.33% 54.01% 
PM_1002175 5 561 329 —880.71 1 126. 62 33.57 3 077. 67 10.20% 55.34% 
PM_1002159 5 601 357 -646.50 1 040. 55 32. 26 2 968.11 9.04% 52. 99% 
PB_2000998 5 653 323 —1 586.34 1 299. 58 36.05 3 072. 53 11.16% 54.35% 
PM_1002166 5 696 343 -1 402.16 1 223.54 34.98 2 947.21 10.20% 51.74% 
PB_1002578 5 885 330 -1 060.70 1 254.23 35.42 3 413.33 10.73% 58.00% 
PB_1002569 5 986 357 171.67 1 006.28 31.72 3 650.39 8. 89% 60. 98% 
PB_2000237 6 081 342 -2 061.57 1 415.37 37. 62 3 072.81 11.00% 50.53% 
PB_1002577 6 259 336 -1710.78 1 410.61 37.56 3 403.93 11.18% 54.38% 
PB_2000733 6 700 335 -2 397.38 1 582.33 39.78 3 430. 86 11.87% 51.21% 
PB_2000638 6 730 341 -1 073.67 1 364.52 36.94 3 851.27 10. 83% 57.23% 
PM_1002149 6 935 357 —1 574.24 1 316. 88 36.29 3 155.36 10. 16% 45. 50% 
PB_1002581 6 941 328 —2 360.04 1 644.91 40.56 3 730.61 12.37% 53.75% 
PM_1002169 6 948 336 —955.35 1 395.03 37.35 4 095.12 11.12% 58.94% 
PB_1002579 7 035 328 -2 023.03 1 630.05 40.37 4 005.20 12.31% 56.93% 
PM_1002170 7 499 336 —1 514.45 1 597. 87 39.97 4 378. 85 11.90% 58.39% 
PM_1002155 8 088 357 -3 181.36 1 725.35 41.54 3 248.33 11.64% 40. 16% 
PB_1002575 8 884 336 -2 460.17 1 920. 67 43.83 4 800.39 13.04% 54.03% 
PB_2000598 9 338 320 -2 500.76 2 085.75 45. 67 5 469. 80 14.27% 58.58% 
PM_1002164 10 137 323 —1 249.03 1 897.55 43.56 5 912.61 13.49% 58.33% 
PM_1002160 10 259 323 -2 255.22 2 020.42 44.95 5 433. 53 13.92% 52.96% 
PM_1002152 10 533 357 -2 310. 13 1 890. 60 43.48 4 821. 83 12. 18% 45.78% 
PB_1002573 16 043 347 —594. 83 2 888.60 53.75 10 914. 13 15.49% 68.03% 
PB_2000225 17 666 333 -6 418.30 4 070.51 63. 80 10 497.76 19.16% 59.42% 
PM_1002158 17 961 323 256. 58 3 049.60 55.22 12 489.71 17.10% 69.54% 
PB_1002570 21 768 355 -1 727.39 3 908.23 62.52 14 434.76 17.61% 66.31% 


除 计算 的 标准 化 特别 节点 S(x,y) , 表 6 中 也 计算 。 计算 P, 和 P, 的 描述 统计 量 如 表 7 所 示 : 


统计 了 拟 合 对 数 函 数 的 两 个 参数 b。 和 6, 以 及 每 篇 论 表 7 P, 和 P, 的 描述 统计 量 

文 的 x 与 D 的 比值 P,, 以 及 y 与 V 的 比值 P,。P, 和 P， 最 小 值 最 大 值 平均 值 。 ”标准 偏差 
分 别 表示 论文 发 表 到 $ 点 这 一 天 ,其 发 表 天 数 和 累积 rn G85% 19.16% ll.39% 2.63% 
的 总 浏览 量 占 论文 发 表 D 天 之 后 对 应 数值 的 百分比 。 一 2 2 4% 
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表 7 显示 ,本 研究 所 求 特别 节点 的 效果 非常 显著 ， 

所 划分 的 集中 浏览 期 平均 只 占 总 发 表 天 数 的 11.39% ， 
但 集中 浏览 期 累积 的 总 浏览 量 却 达 到 了 全 程 累积 的 总 
浏览 量 的 55.08% 。 即 研究 论文 在 约 40 天 的 集中 浏览 
期 中 所 获得 的 浏览 量 超过 了 其 一 年 内 所 能 累积 浏览 量 
的 一 半 以 上 。 因 此 ,可 以 初步 认为 ,根据 集中 浏览 期 的 
数据 可 以 基本 判断 该 论文 一 年 的 浏览 量 情况 ,也 就 是 


x10 


说 可 以 用 较 短 的 时 间 来 预测 某 期 刊 论文 浏览 量 在 一 年 
中 的 发 展 状况 。 
3.3 特别 节点 $ 的 位 置 及 其 分 布 规律 

为 了 更 好 地 观察 特别 节点 S(x,y) 的 位 置 ,利用 软 
件 绘制 每 篇 论文 总 浏览 量 累 计 观 测 值 所 拟 合 的 对 数 函 


数 的 曲线 并 用 圆 点 标注 出 S(x,y) ,如 图 5 所 示 : 
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图 5 


见 察 图 5 可 以 发 现 ,每 条 函数 曲线 的 圆 点 左 侧 时 
快速 增长 的 趋势 , 右 侧 则 表现 为 缓慢 增长 的 趋势 。 可 
羽 阐 观 地 看 出 ,特别 节点 成 功 地 将 总 浏览 量 累 积 曲线 
分 起 了 集中 阅读 阶段 和 分 散 阅读 阶段 两 个 阶段 。 
< 除 此 之 外 ,图 5 显示 总 浏览 量 累积 量 越 高 , 即 受 关 
En s 的 x 值 越 大 。 计 算 

与 节点 $ 的 x 值 的 皮尔 逊 相关 系数 为 0.96 ,表示 

小 与 论文 受 关注 程度 呈现 出 非常 显著 的 正 相 关 关 
系 。 说 明 论文 受到 的 关注 程度 越 高 ,其 集中 浏览 期 持 
续 的 时 间 越 长 。 

为 研究 集中 浏览 期 的 时 间 长 度 , 即 节点 5 的 « 什 
的 分 布 规律 ,作出 x 的 频率 直方 图 ,如 图 6 所 示 ; 
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图 6 5 点 x 的 频率 直方 图 
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样本 论文 总 浏览 量 的 拟 合 对 数 函 数 曲线 与 特别 节点 S(x,y) 


图 6 显示,S 节点 的 x 分 布 相对 集中 , 即 样本 论文 
的 集中 浏览 期 长 度 相差 不 大 ,与 正 态 分 布 相 似 ,利用 
SPSS 的 单 样本 K.-S 检验 ,对 x 进行 常态 性 检验 ,结果 见 
表 11。5 节点 的 x 平均 值 为 38, 即 集中 浏览 期 平均 为 
38 天 ,符合 正 态 分 布 。 

表 11 节点 S 的 横 坐 标 X 的 单 样本 Kolmogorov- 
Smirnov 检验 结果 


x 的 单 样本 Kolmogorov-Smirnov 检验 


计数 38 
正 态 参数 ab 平均 值 38.38 
标准 偏差 8.73 
最 极端 差分 绝对 0.17 
正 0.17 
负 -0.12 
检验 统计 0.17 


渐 近 显著 性 ( 双 尾 ) -010° 


a. 检验 分 布 是 正 态 分 布 。 
b. 根据 数据 计算 。 
c，Lilliefors 显著 性 校正 。 


4 结果 及 讨论 


通过 对 PLoS Medicine 和 PLoS Biology 两 种 期 刊 
2016 年 11 月 发 表 的 38 篇 研究 论文 (其 中 PLoS Medi- 
cine 发 表 16 篇 ,PLoS Biology 发 表 22 篇 ) 的 浏览 量 数 
据 的 追踪 统计 ,本 研究 得 出 下 列 研 究 结 

(1) 总 浏览 量 累积 曲线 呈 规 律 性 增长 ,增长 速度 
先 快 后 慢 ,说 明 研 究 人 员 在 浏览 期 刊 网 站 时 更 倾向 于 


1 ] 二 | 
王 真 ， 马 建华 .基于 PLoS 开放 获取 数据 的 单 篇 论文 网 络 浏览 量 累积 规律 的 数理 统计 及 分 析 [ 人 贞 n a V1 人 提出 
C1 


点 击 最 新 发 表 的 论文 。 究 的 结论 及 可 靠 性 奠定 了 基础 。 然 而 ,假如 研究 对 象 
(2) 对 总 浏览 量 的 累计 曲线 进行 曲线 拟 合 ,发 现 不 是 在 OA 的 开放 平台 ,或 者 说 研究 论文 所 在 期 刊 不 

其 与 对 数 函 数 曲 线 的 拟 合 优 度 非常 高 ,其 平均 值 为 0。 ”是 领域 内 的 重要 期 刊 ,会 得 出 怎样 的 结论 ,现在 还 是 不 

97 , 且 拟 合 优 度 不 受 论文 所 受 关注 度 的 影响 。 得 而 知 。 未 来 研究 将 选择 不 一 样 特 点 的 期 刊 论文 , 进 
(3) 本 研究 定义 了 特别 节点 S(x,y) 以 及 单 篇 论文 ”一步 发 现 各 种 类 型 论文 的 传播 特征 和 规律 ,完善 现 有 

的 集中 浏览 期 和 分 散 浏览 期 的 意义 ,并 给 出 了 一 种 可 ”的 研究 结论 ,对 期 刊 出 版 提供 更 科学 的 理论 依据 。 
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Mathematical Statistics and Analysis of Cumulative Rules of Single Paper 
Web Browsing Based on PLoS Open Access Data 
Wang Zhen Ma Jianhua 
University of Chinese Academy of Sciences, Beijing 100049 
National Science Library, Chinese Academy of Sciences, Beijing 100190 

Abstract: [Purpose/significance | The purpose of this paper is to research the cumulative rules of PLoS OA arti- 
cles’” views in online media and to enrich the research methods of Altmetrics by mathematical statistics. [ Method/ 
process | The tracking data for 38 research papers published in November 2016 by PLoS Biology and PLoS Medicine are 
collected until October 16, 2017. By using the method of curve fitting and special node calculation, the statistical analysis 
and test of the recorded data are carried out to explore the cumulative rule of the total page view index. | Result/conclu- 
sion | The goodness of fit of logarithmic curve to the cumulative curve of total views is the best, with an average of 0. 97. 
The special point S(x,y) of the cumulative curve is calculated, and the cumulative curve of total views is successfully di- 
vided into two stages : centralized view period and decentralized view period of which the centralized view period accounts 
for about 10% of all stage, while the view volume exceeds 55% of all stage. 


Keywords: single article Altmetrics page view curve fitting special point cumulative rules 
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